랜덤 포레스트 - 훌륭한 개발자 블로그

digits에서 랜덤 포레스트와 주성분 분석의 기여율을 비교해 본다

같은 데이터를 여러가지 방법을 사용해, 엉망진창 분석하는 것은 데이터 분석의 기본중의 기본(?)이므로… Random Forest는 매개변수 기여율까지 낼 수 있는 장점이 있습니다. 이번에는 digits를 Random Forest에서 학습시켜 보고, 1회째로 분석한 PCA와 비교해 가고 싶습니다. Random Forest를 사용해보기 sklearn은 기계 학습의 알고리즘이 변화해도, 같은 쓰는...

파이썬랜덤 포레스트scikit-learn주성분 분석

데이터 과학 초보자 메모 [2일째]

에 이어 2번째입니다. 마찬가지로, 받은 데이터를 만나갑니다. 마지막으로 작성한 히트 맵에 이어 산점도 행렬을 작성하여 데이터를 시각화합니다. 히트 맵과 산점도 행렬에서 목적 변수와 상관 관계가있는 몇 가지 특징이 있음을 발견했습니다. 그 특징으로부터 새로운 특징을 만들 수 있을 것 같다 → 새로운 특징 작성 이 새로운 특징으로 목표 변수를 설명 할 수 있다고 생각합니다. train_test...

pandas파이썬랜덤 포레스트scikit-learn데이터 과학